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数据 融合 研究 的 主题 与 方法 趋势 
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摘 要 :[ 目的 /意义 ] 数据 融合 是 实现 多 源 数据 价值 的 重要 途径 ， 全 面 分 析 全 球 数据 融合 研究 的 整体 主 
题 格 局 ， 对 当前 认识 和 研究 数据 融合 有 重要 的 科技 情报 价值 。[ 方法 /过程 ] 采用 词 频 与 共 词 分 析 法 ， 对 Web 
of Science 核心 数据 集中 16 053 篇 数据 融合 研究 论文 的 热点 主题 和 研究 方法 进行 了 分 析 。[ 结果 /结论 ] 数据 
融合 研究 在 整体 上 呈现 了 显著 的 增长 趋势 ， 且 经 过 30 余年 的 发 展 已 经 形成 了 核心 的 研究 热点 和 数据 融合 方法 。 
在 研究 中 ， 传 感 器 (包括 无 线 传感器 ) 数据 融合 是 该 领域 的 研究 热点 方向 。 故 障 诊断 、 遥 感 、 安 全 以 及 智能 
电网 等 是 数据 融合 应 用 的 热点 场景 。 卡 尔 曼 滤 波 法 、 神 经 网 络 、Dempster-Shafer 证 据 理论 以 及 机 器 学 习 ( 包 
括 深度 学 习 、 支 持 向 量 机 等 ) 等 是 数据 融合 的 热点 方法 ， 且 数据 融合 研究 中 已 经 形成 了 多 方法 共 现 协 同 网 络 。 
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存在 。 鉴 于 数据 融合 在 整合 对 象 情报 中 的 重要 应 用 价值 ，20 世纪 90 年 代 ， 美 国 军事 领域 开始 
关注 并 研究 数据 融合 问题 。20 世纪 80 年 代 ， 由 美国 国防 部 联合 实验 室 IDL (Joint Directors of 
Laboratories) 主导 ， 成 立 数据 融合 工作 组 (Data Fusion Working Group )'! 1， 开 始 系 统 开展 数据 融 
合 的 研究 。 在 研究 中 ，JDL 根据 军事 上 对 数据 融合 的 需求 ， 将 数据 融合 定义 为 : 把 来 自 多 个 传 感 
器 和 信息 源 的 数据 加 以 关联 (association ) 、 相 关 (correlation ) 以 及 集成 (combination ) 的 过 程 ， 
以 获得 准确 的 位 置 和 身份 估计 (position & identify estimation )， 从 而 全 面 细致 地 对 态势 、 威 胁 和 重 
要 性 做 出 评估 i, JDL 的 数据 融合 概念 和 模式 ， 在 后 来 的 数据 融合 研究 与 应 用 中 发 挥 了 重要 作用 。 


* 本 文系 中 国 科 学 院 文献 情报 能 力 建设 专项 项 目 “ 研 发 数据 组 织 与 分 析 挖 气 的 每 能 技术 ”( 项 目 编号 : E1290002 ) 的 研究 成 果 之 一 。 
[ 作者 简介 ] ZA (ORCID: 0000-0002-4096-2795 ) , 3, SIAR, HEL, Email: lijie2022@mail.las.ac.cn ( 通讯 作者 ) ; 
于 倩 倩 (ORCID: 0000-0001-8777-1171) ， 女 ， 副 研究 馆 员 ， 硕 士 ，Email: yuqiangian@mail.las.ac.cn; £43 (ORCID: 
0000 一 0003 一 2539 一 2218 ) ， 女 ， 馆 员 ， 硕 士 ，Email: wangyj@mail.las.ac.cn。 


026 


275, Hate, EER. 数据 融合 研究 的 主题 与 方法 趋势 [J]. 文献 与 数据 学 报 ，2023，5 ( 3 ) : 026-041. 


虽然 ， 数 据 融合 的 讨论 与 研究 已 经 有 30 余年 的 历史 ,但 随 着 时 代 发 展 ， 数 据 的 内 涵 和 外 延 发 生 
了 变化 。 在 新 的 数字 化 时 代 下 ， 重 新 审视 数据 融合 问题 很 有 必要 。 

当前 ， 数 字 化 、 数 据 化 以 及 数 智 化 程度 进一步 深化 ， 集 成 和 融合 多 源 数 据 进行 问题 解答 ， 
成 为 当前 复杂 信息 环境 下 数据 驱动 问题 解决 的 一 个 新 兴 热 点 。 知 识 管理 的 data-information- 
knowledge-wisdom 模型 ， 向 我 们 展示 了 从 数据 到 智慧 的 数据 赋 能 过 程 ， 数 据 、 信 息 以 及 知识 的 融 
合 ， 是 实现 智慧 化 的 基础 。 通 过 文献 调查 发 现 ， 在 目前 的 学 术 研 究 中 ， 数 据 融合 、 信 息 融 合 和 
知识 融合 界限 并 不 明确 。 在 实际 的 应 用 中 ， 学 者 往往 根据 个 人 或 所 在 研究 领域 学 者 的 偏好 而 随 
机 使 用 。 有 学 者 对 三 者 进行 了 比较 和 讨论 ， 如 祝 振 媛 和 李 广 建 教授 对 数据 融合 、 信 息 融 合 、 知 
识 融 合 的 关联 与 比较 分 析 发 现 ， 数 据 融 合 与 信息 融合 的 研究 内 容 日 益 趋 同 ， 人 研究 边界 并 不 十 分 
清晰 ; 知识 融合 主要 侧重 对 文献 与 知识 的 融合 ， 具 体 表现 在 知识 库 的 建设 、 知 识 地 图 的 构建 、 
本 体 的 构建 等 方面 ， 这 些 方面 更 强调 语义 和 资源 之 间 关 系 的 组 织 与 表达 1 。 但 从 知识 融合 的 研 
究 来 看 ， 仅 仅 是 融合 的 对 象 发 生 了 变化 〈 即 将 文献 数据 等 与 知识 关联 密切 的 数据 当 作 知 识 来 融 
合 )， 其 本 质 与 数据 融合 和 信息 融合 并 没有 显著 的 区 别 。 笔 者 认为 ， 按 照 DIKW 模型 ， 数 据 融 合 
是 最 底层 最 基础 的 融合 模式 ， 是 信息 融合 、 知 识 融 合 以 及 情报 融合 的 基础 。 在 理论 上 ， 信 息 融 
合 、 知 识 融合 以 及 情报 融合 是 数据 高 维度 的 融合 ， 因 此 数据 融合 应 该 包括 信息 融合 、 知 识 融合 
以 及 情报 融合 。 

数据 融合 的 技术 与 方法 ,已 经 渗透 到 了 科学 研究 的 方方面面 。 在 天 文学 领域 ,科学 家 通过 多 
源 数据 与 信息 融合 技术 ， 探 索 和 绘制 宇宙 画像 ( 例如: 首 张 黑洞 照片 的 合成 )。 在 自动 化 领域 ， 
通过 融合 多 源 传 感 吕 的 数据 〈 例 如 : 温度 、 图 像 、 声 音 、 振 动 等 等 )， 以 实现 控制 系统 的 智能 化 
(例如 : 自动 驾驶 )。 在 科技 情报 领域 ， 各 类 科技 文献 情报 源 的 融合 赋 能 ， 已 经 成 为 实现 “整体 
情报 观 ” 和 “精准 情报 观 ” 的 必由之路 。 综 合集 成 思想 A 和 融合 各 个 领域 专家 知识 的 决策 思想 
和 方法 ， 已 经 成 为 复杂 问题 决策 过 程 中 的 重要 方法 。 长 期 以 来 ， 不 同 专业 领域 的 学 者 从 领域 需求 
的 角度 出 发 ， 对 数据 融合 理论 、 技 术 、 方 法 等 都 进行 了 相关 研究 分 析 。 但 由 于 迫切 程度 不 同 ,各 
个 领域 在 数据 融合 实际 应 用 方面 又 存在 一 定 的 差异 。 在 科技 情报 领域 ， 数 据 融合 发 展 相 对 比较 组 
慢 。 科 技 文献 数 据 融 合 主要 以 科技 论文 为 核心 ， 与 专利 、 政 策 、 社 交 媒 体 等 数据 类 型 关联 ， 以 
从 不 同 视角 来 研究 科学 与 技术 (S-T)、 科 学 与 政策 (S-P) 以 及 科学 与 媒体 的 互动 。 在 医学 科技 
信息 的 研究 中 ， 通 过 融合 病历 的 各 类 诊断 信息 ， 能 有 效 地 发 现 潜在 的 健康 隐患 ， 进 而 为 “精准 医 
学 ”“ 治 未 病 ” 提 供 决策 依据 。 除 了 以 上 提 及 到 的 数据 融合 场景 外 ， 数 据 融合 在 时 时 刻 刻 地 影响 
着 人 类 生产 、 生 活 以 及 生存 ， 全 面 认识 数据 融合 研究 意义 重大 。 

国内 外 已 有 相关 学 者 对 多 源 数据 融合 的 理论 、 模 型 方法 和 应 用 做 了 调查 和 综述 分 析 。 如 ， 韩 
增 奇 等 对 信息 融合 技术 进行 了 全 面 综 述 ， 回 顾 国内 外 的 发 展 状 况 ， 主 要 对 信息 融合 的 定义 、 
层次 结构 、 经 典 方法 以 及 应 用 做 了 全 面 的 综述 ， 为 认识 信息 融合 的 研究 态势 提供 了 详实 的 研究 基 
础 。 于 佳 会 等 1 中 通过 中 国 知 网 的 数据 ， 对 国内 多 源 多 维 数据 融合 研究 态势 ， 从 理论 、 方 法 以 及 
应 用 三 个 方面 进行 了 分 析 。Castanedo7 AI Alofi 等 1*1 先 后 对 数据 融合 的 技术 进行 全 面 梳 理 和 综述 ， 
为 全 面 认识 数据 融合 技术 和 流程 提供 了 全 景 素材 。 此 外 ， 相 关 学 者 也 在 不 同 程度 上 对 数据 融合 的 
模型 、 方 法 和 应 用 等 进行 了 系统 综述 和 讨论 '”"1。 通 过 对 以 往 的 数据 融合 综述 的 分 析 ， 发 现 传 


027 


xm 5% AHA 
第 5 卷 第 3 期 2023 年 9 月 


感 带 数据 是 数据 融合 的 核心 领域 ， 在 该 领域 已 经 发 展 形成 了 一 套 较为 完整 的 数据 融合 流程 、 模 型 
和 奉 干 技术 方法 。 在 以 往 的 研究 基础 上 ， 为 了 更 加 全 面 认识 数据 融合 的 研究 热点 主题 和 方法 群 ， 
本 文 利用 国际 性 的 Web of Science 数据 库 ， 全 面 采集 数据 融合 的 研究 文献 ， 采 用 关键 词 词 频 和 共 
词 分 析 ( co-words ) 的 方法 ， 对 全 球 数据 融合 的 研究 态势 以 及 核心 的 数据 融合 方法 进行 研究 与 分 
析 ， 以 期 为 我 国 在 复杂 信息 环境 下 ， 基 于 数据 驱动 的 决策 提供 科技 情报 支撑 。 


1 数据 与 方法 


1.1 数据 来 源 

本 文 数据 来 源 于 Web of Science 核心 合集 ， 子 数据 库 选 择 了 SCL/SSCI 期刊 论文 和 CPCI 会 
议论 文 数据 库 。 在 数据 检索 时 ， 按 照 前 期 的 调研 结果 ， 在 数据 融合 、 信 息 融 合 和 知识 融合 缺乏 
清晰 界定 的 背景 下 ， 本 文 使 用 “数据 融合 ”来 统称 三 种 数据 融合 提 法 。 在 数据 检索 中 分 别 使 用 
fusion, integration, aggregation 来 作为 “融合 ”的 英文 表达 ， 进 行 数据 检索 。 检 索 时 间 范 围 设 定 
为 1900~2021， 以 获取 截止 到 2021 年 的 所 有 数据 融合 科技 文献 数据 。 最 终 的 数据 检索 式 如 下 : 


(TI= ( “data fusion*” OR “data integrat*” OR “data aggregat*” OR “information fusion*” OR 


“information integrat*” OR “information aggregat*” OR “knowledge fusion*” OR “knowledge integrat*” 
OR “knowledge ageregat*” ) AND FPY=1900-2021 ) AND LA= ( English ) 

通过 数据 检索 ， 共 得 到 1966~2021 年 间 发 表 的 16 053 篇 数据 融合 研究 论文 ， 产 出 趋势 如 图 1。 
从 论文 产 出 的 阶段 特征 来 看 ， 可 以 将 数据 融合 的 发 展 划分 为 四 个 时 期 : 萌芽 期 、 缓 慢 发 展期 、 快 
速 发 展期 G) 和 快速 发 展期 (I )。1966~1989 年 数据 融合 的 研究 关注 度 很 低 ， 这 与 当时 数据 融 
合 的 需求 和 数字 化 的 发 展 程度 比较 低 有 关 。 该 阶段 整体 上 数据 处 理 规模 比较 小 ， 单 一 数据 源 的 
分 析 尚 且 处 于 小 数据 时 代 ， 对 多 源 数据 融合 的 需求 很 少 。1990~1998 年 ， 数 据 融 合 的 论文 产 出 要 
比 上 一 个 阶段 活跃 ， 但 整体 产 出 量 仍然 处 于 比较 低 的 水 平 ， 甚 至 在 1999 年 出 现 了 小 幅度 的 下 降 。 
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1 全球 数据 融合 科研 论文 产 出 趋势 ( 1966~2021 年 ) 


028 


27k, Tats, EE .数据 融合 研究 的 主题 与 方法 趋势 [ J ] . 文献 与 数据 学 报 ，2023，5 ( 3) : 026-041. 


1999~2009 年 ， 数 据 融 合 的 论文 产 出 量 进入 快速 发 展期 (I)， 呈 现 显著 增长 趋势 ， 表 明 该 阶段 对 
数据 融合 的 需求 和 关注 增加 。 论 文 产 出 在 2010 年 经 过 小 幅度 下 降 后 ， 又 开始 了 快速 的 增长 ， 进 
入 快速 发 展期 ( 工 )。2010~2021 年 ， 大 数据 、 人 工 智 能 、 物 联网 等 数据 采集 、 数 据 处 理 和 分 析 技 
术 发 展 迅 速 ， 数 据 融 合 的 技术 和 实际 应 用 需求 有 了 空前 的 增加 ， 数 据 融 合 的 科研 产 出 又 迎 来 了 新 
的 增长 期 。 

1.2 ”研究 方法 

为 了 探索 数据 融合 的 研究 主题 特征 ， 本 研究 从 词 频 和 共 词 两 个 维度 对 数据 融合 的 主题 进行 
分 析 。 词 频 统 计 分 析 是 指 以 所 采集 的 数据 融合 论文 数据 为 样本 ， 从 数据 集合 的 关键 词 字段 (DE ) 
中 ， 提 取 并 统计 每 一 个 关键 词 出 现 的 次 数 ， 以 出 现 次 数 来 衡量 关键 词 的 热度 。 在 科技 文献 数据 分 
析 中 ， 通 常 使 用 高 频 的 关键 词 来 表征 文献 数据 集 的 研究 热点 。 关 键 词 词 频 分 析 仅仅 从 单 维度 呈现 
文献 数据 集 的 研究 内 容 ， 缺 乏 对 关键 词 与 关键 词 之 间 语 义 关 系 的 揭示 。 因 此 ， 在 词 频 分 析 的 基础 
上 ， 进 一 步 通过 共 词 分 析 的 方法 ， 对 数据 融合 的 研究 主题 网 络 进行 分 析 。 

共 词 分 析 的 提出 最 早 可 以 追溯 到 20 世纪 80 年 代 ， 以 法 国 科学 研究 中 心 的 Callon AO Hy 
版 的 《科学 技术 动态 图 谱 》 为 代表 。 随 着 共 词 使 用 的 不 断 广泛 ， 其 基本 的 分 析 流 程 和 模式 已 经 
形成 。 首 先 ， 需要 通过 文本 挖 气 或 提取 技术 ,识别 有 意义 的 术语 ; 在 用 户 定义 的 “关联 或 共 现 ” 
规则 的 约束 下 ， 构 建 术语 与 术语 之 间 的 关系 矩阵 ; 然后 ， 对 所 生成 的 共 词 矩阵 进行 统计 学 或 数 
学 处 理 ， 以 解释 研究 领域 的 主题 特征 。 早 期 的 共 词 矩阵 常常 使 用 SPSS 来 进行 处 理 ， 以 完成 词 对 
在 二 维 空间 的 映射 和 词 矩 阵 的 层次 聚 类 。 近 年 来 ， 数 据 库 技术 和 知识 图 谱 工 具 发 展 迅速 ， 使 得 
共 词 分 析 更 加 便捷 。 例 如 ， 近 年 来 兴起 的 CiteSpace、VOSviewer 以 及 SCIMAT 软件 等 ， 特 别 是 
VOSviewer 整合 了 主题 词 的 映射 和 聚 类 技术 ， 很 大 程度 上 提高 了 共 词 分 析 的 效率 和 效果 。 因 此 ， 
本 研究 选取 数据 融合 论文 的 关键 词 作为 分 析 的 对 象 ， 使 用 VOSviewer 科学 知识 图 谱 工 具 对 关键 词 
的 词 频 和 共 词 网 络 进行 分 析 2B 


关键 词 直接 表征 了 论文 的 研究 内 容 ， 是 通过 文献 数据 进行 科学 研究 热点 分 析 的 重要 元 素 。 
本 研究 从 16 053 篇 论文 中 提取 词 频 不 小 于 10 次 的 418 个 关键 词 ， 构 建 了 数据 融合 主题 网 络 ， 
如 图 2 (显示 了 TOP 500 的 连 线 )。 本 研究 对 关键 词 进行 了 清洗 和 消 歧 处 理 ， 即 删除 了 无 意义 的 
关键 词 ， 合 并 了 异形 同 义 等 关键 词 ; 为 了 了 解数 据 融合 不 同形 式 所 使 用 的 场景 俩 好 ， 在 分 析 过 程 
中 未 对 检索 式 中 表征 数据 融合 的 同 义 关键 词 进行 合 并 。 

数据 融合 关键 词 的 词 频 分 析 结 果 显 示 : 除了 检索 词 以 外 ， 词 频 不 小 于 100 次 的 热点 关键 词 为 
wireless sensor networks ( 无 线 传感器 网 络 ，872 次 )、kalman filter ( 卡尔 曼 滤 波 法 ，228 次 ) multi- 
sensor data fusion( 多 传感器 数据 融合 ，213 YC), sensor fusion( 传 感 融合 ，209 次 )、neural network( 神 
经 网 络 ，205 次 )、D-S evidence theory( D-S 证 据 理论 ，201 次 )、internet of things( 物 联 网 ，195 次 )、 
ontology ( 本 体 ，195 次 )、machine learning ( 机 器 学 习 ，180 次 )、fault diagnosis ( 故障 诊断 ，174 次 )、 
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(b) 数据 融合 的 研究 主题 演化 
图 2 ”数据 融合 研究 主题 的 共 现 网 络 
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sensor networks ( 传 感 需 网 络 ，164 次 )、deep learning ( 深度 学 习 ，152 次 )、support vector machine ( 支 
持 向 量 机 ，148 次 ) remote sensing ( 遥感 ，144 次 ) clustering ( 聚 类 ，135 次 ) sensors ( (EIRA, 
135 次 )、multi-sensor data fusion (多 传 感 需 数据 融合 ，127 次 )、multi-sensor ( 多 传 感 带 ，124 次 )、 
classification( 分 类 ，116 次 )、 big data( 大 数据 ，114 次 )、 security( 安全 ，112 次 ) 以 及 smart grid( 智 
能 电网 ，102 次 )。 从 这 些 高 频 关 键 词 的 结果 来 看 ， 传 感 融 数据 融合 是 当前 研究 的 热点 领域 (涉及 
的 高 频 词 有 wireless sensor networks, multi-sensor data fusion, sensor fusion, sensor networks, sensors 
以 及 multi-sensor )。 这 是 自动 化 、 人 工 智能 、 物 联网 等 新 兴 技 术 发 展 的 必然 。 其 中 ， 无 线 传 感 需 
网 络 ( 以 下 简称 “WSN”) 集成 了 传 感 咒 、 微 机 电 系 统 和 网 络 技术 ， 是 一 种 全 新 的 信息 获取 和 处 
理 技术 ， 在 军事 领域 、 环 境 科学 、 医 疗 检测 以 及 空间 探测 等 领域 都 有 重要 的 应 用 价值 1。 特别 是 
WSN 还 存在 一 些 显著 的 特点 ， 例 如 : WSN 数据 存在 很 大 的 元 余 ， 使 得 WSN 很 少 出 现 运行 的 问题 ， 
可 以 便捷 和 快速 地 进行 信息 传输 和 分 享 ， 提 升 了 系统 的 应 急 能 力 和 情报 的 时 效 性 。 数 据 融 合 的 相 
关 场 景 或 领域 热点 关键 词 主要 为 故障 诊断 、 遥 感 、 大 数据 、 安 全 以 及 智能 电网 等 。 高 频 关 键 词 在 
时 间 维 度 上 的 分 布 如 图 2 (b )。 图 中 ， 关 键 词 的 节点 颜色 越 接近 暖色 ， 则 关键 词 在 近期 就 越 活跃 。 
分 析 结 果 显 示 ， 数 据 融合 无 论 是 在 解决 问题 的 场景 ， 还 是 所 采用 的 技术 和 方法 都 是 与 时 俱 进 的 。 
目前 ， 数 据 融 合 关 键 词 群 中 最 为 活跃 的 十 大 关键 词 分 别 为 covid-19 ( 新 冠 ) task analysis ( 任务 分 
析 )、computational modeling ( 计算 模型 )、knowledge graph ( 知识 图 谱 )、transfer learning ( 迁移 学 习 )、 
cameras ( 摄像 机 )、blockchain( 区 块 链 )、convolutional neural network ( 卷 积 神经 网 络 )、sentinel-2( 哨 
兵 2 号 高 分 辩 率 多 光谱 成 像 卫 星 ) 以 及 deep learning 深度 学 习 )。 

从 共 词 网 络 的 角度 对 主题 进行 聚 类 分 析 ， 结 果 如 表 1。 分 析 表 明 ， 虽 然 中 文 将 fusion、 
integration 以 及 aggregation 都 译 为 “融合 ” ， 但 聚 类 的 结果 表明 它们 之 间 在 使 用 的 场景 上 存在 显 
车 的 偏好 。 当 前 的 关键 词 肾 类 ， 主 要 以 检索 词 为 各 类 中 的 代表 词 ， 将 研究 划分 为 #1 data fusion, 
#2 data integration 和 #3 data aggregation, 3828 #1 MRX #3 所 呈现 的 研究 都 在 关注 传 感 需 数 据 的 
融合 ， 即 传 感 右 数据 融合 的 研究 中 多 使 用 data fusion 和 data aggregation 来 表征 数据 融合 。 虽 然 
#1 和 #3 都 是 传感器 数据 融合 ， 但 也 存在 一 定 的 差异 。 其 中 ， 闻 data aggregation 的 关键 词 群 主 要 
集中 在 WSN 的 数据 融合 研究 方向 ， 提 data fusion 则 集中 在 多 源 传感器 数据 的 融合 。 聚 类 #2 data 
integration 的 关键 词 词 群 则 与 所 和 将 显著 不 同 ， 该 类 表征 为 网 络 或 文献 数据 的 融合 。 


表 1 数据 融合 关键 词 聚 类 中 的 高 频 词 


编号 关键 词 词 频 ( 词 频 = 论文 数 ) 


主题 词 : data fusion ( 数据 融合 ，2384 ) 、information fusion ( 信息 融合 ，988 ) 、 
multi-sensor data fusion ( 多 源 传感器 数据 融合 ，213 ) 、sensor fusion ( 传感器 融合 ， 
209) 、fault diagnosis ( 故障 诊断 ，174 ) 、remote sensing ( 遥感 ，144 ) | sensors 
(传感器 ，135 ) 、multi-sensor ( 多 传感器 ，124 ) 、feature extraction ( 特征 提取 ， 
#1 data fusion 77) , lidar (BOtHIA, 75) . 
1 (传感器 数据 与 信 
SME) 方法 词 : kalman filter ( F 4K S YE YE, 228) . neural network ( 神经 网 络 ，205 ) 、 
D-S evidence theory (D-S 证 据 理 论 ，201 ) , machine learning ( 机 器 学 习 ，180 ) 、 
deep learning ( PR EB AF J, 152) . support vector machine ( Sy FF [a] PL, 148) , 
classification ( 分 类 , 116), fuzzy logic ( 模糊 逻辑 , 90 ) . convolutional neural network ( 卷 
积 神经 网 络 ，80 ) 。 
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编号 关键 词 词 频 ( 词 频 -论文 数 ) 


主题 词 : data integration ( 数据 融合 ，688 ) 、knowledge integration ( 知识 融合 ， 

251) 、information integration ( 信息 融合 ，231) 、 ontology ( AX fK, 195) . web 

service ( PX) 24 AK 4, 73) . xml ( 可 扩展 标记 语言 ，65 ) . decision making ( 决 
策 ，63 ) 、semantic web ( 语义 网 络 ，61 ) 、knowledge fusion ( 知识 融合 ，56 ) 、 

#2 data integration knowledge management (A interoperability ( 互 操作 性 ，50 ) 、multi- 

2 (网 络 、 知 识 数据 agent systems ( 多 主体 系统 ，49 ) 、database ( 数据 库 ，48 ) 、information retrieval 
融合 ) (信息 检索 ，40 ) 、service-oriented architecture ( 面向 服务 的 体系 结构 ，38 ) 、 

bioinformatics ( 生物 信息 学 ，37 ) 、 component (M4, 36). 


方法 词 : big data ( 大 数据 ,114 ) , data mining ( 数据 挖掘 , 90) . GIS ( 地 理 信息 系统 ， 
CADE 


主题 词 : wireless sensor networks ( 无 线 传感器 网 络 , 872 ) data aggregation( 数据 融合 ， 
845) 、internet of things ( 物 联 网 ，195 ) 、sensor networks ( 传感器 网 络 ，164 ) 、 
security (#42, 112) 、smart grid ( 智能 电网 ，102 ) 、aggregation ( 融合 ，91 ) 、 
energy efficiency ( 能 效 ，88 ) 、privacy-preserving ( 隐私 保护 ，84 ) 、privacy ( 隐私 ， 
77) 、information aggregation (信息 融合 ，68) . reliability ( H re S energy 
consumption ( JEFE, 51 ) , network lifetime ( 网 络 寿命 , 49 ) , data privacy ( 数据 隐私 ， 


#3 data aggregation 
3 (无 线 传感器 网 络 


数据 融合 ) 48 ) 、homomorphic encryption ( 同 态 加 密 ，48 ) 。 
方法 词 : clustering (3828, 135) 、cloud computing ( 云 计算 ，57 ) algorithms (4 
法 ，48 ) . optimization (优化 ，46 ) 。 
2.2 数据 融合 的 热点 方法 与 趋势 


数据 融合 方法 的 剖析 和 总 结 ， 对 实际 的 数据 融合 研究 有 重要 指导 意义 。 在 以 往 研 究 中 ， 
Jitendra '?! 兽 系统 性 地 将 传感器 数据 融合 的 数学 方法 总 结 为 : 概率 数据 融合 方法 ; 模糊 逻辑 与 可 
能 性 理论 的 数据 融合 ; 滤波 、 目 标 追 踪 和 运动 学 数据 融合 ; 无 中 心 数 据 融合 系统 ; 成 分 分 析 与 数 
据 融合 以 及 图 像 代 数 数据 融合 等 。 在 国内 ， 数 据 融合 与 信息 融合 的 相关 综述 性 或 科学 计量 类 文 
献 ， 也 在 不 同 层面 上 总 结 了 数据 融合 的 分 析 方 法 ' 5 5。 本 部 分 在 关键 词 整体 网 络 的 基础 上 ， 进 一 
步 提 取 了 TOP 30 的 数据 融合 方法 ， 如 图 3。 数 据 融 合 研 究 应 用 的 十 大 方法 为 卡尔 曼 滤 波 法 (228 
次 )、 神 经 网 络 (205 次 )、D-S 证 据 理 论 (201 次 )、 机 器 学 习 (180 次 )、 深 度 学 习 (152 次 )、 
支持 向 量 机 (148 次 )、 聚 类 ( 135 次， 上 位 方法 )、 分 类 (116 次 ， 上 位 方法 )、 大 数据 ( 114 次， 
上 位 方法 )、 数 据 挖掘 (90 次， 上 位 方法 ) 以 及 模糊 逻辑 ( 90 次 )。 从 方法 应 用 论文 的 平均 时 间 
来 看 ,模糊 逻辑 、 小 波 分 析 、 神 经 网 络 以 及 遗传 算法 等 是 最 早 一 批 数 据 融 合 分 析 方 法 。 从 早期 方 
法 应 用 来 看 ， 卡 尔 曼 滤 波 法 、 证 据 理论 以 及 支持 向 量 机 在 数据 融合 中 具有 高 的 使 用 频次 ， 是 数据 
融合 中 的 热点 方法 。 近 期 在 大 数据 和 人 工 智 能 背景 下 ， 卷 积 神经 网 络 、 深 度 学 习 、 雾 计算 以 及 机 
器 学 习 等 是 新 兴 的 数据 融合 方法 。 通 过 方法 的 共 现 网 络 分 析 ， 提 取 了 方法 的 关系 ， 涉 及 了 方法 的 
隶属 关系 、 协 同 关系 等 方法 关联 模式 。 图 4 呈现 了 数据 融合 的 方法 协同 网 络 ， 两 个 方法 之 间 有 连 
线 ， 则 表明 两 种 方法 存在 同时 使 用 的 情况 ， 连 线 越 宽 则 两 个 方法 在 一 起 使 用 的 频次 越 高 。 主 要 的 
方法 关系 对 为 : 深度 学 习 一 卷 积 神经 网 络 、 神 经 网 络 一 模糊 逻辑 、 神 经 网 络 一 DS 证 据 理 论 、 深 
度 学 习 一 机 器 学 习 、 深 度 学 习 一 特征 提取 、 神 经 网 络 一 遗传 算法 、 支 持 向 量 机 一 分 类 、 机 器 学 
习 一 神经 网 络 、 支 持 向 量 机 一 特征 提取 ， 等 。 
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根据 以 上 分 析 ， 选 取 几 种 含义 较为 明确 、 应 用 较为 广泛 的 数据 融合 方法 进行 介绍 : 

(1) 卡尔 曼 滤波 法 〈Kalman Filter ) 

1960 年 Kalman |!) 发 表 了 用 递归 方法 解决 离散 数据 线性 滤波 问题 的 论文 ， 后 人 称 其 为 卡尔 
曼 滤波 。 该 方法 的 基本 思想 是 : 以 最 小 均 方 误差 为 最 佳 估计 准则 , 采用 信和 号 与 噪声 的 状态 空间 模 
型 ,利用 前 一 时 刻 的 估计 值 和 当前 时 刻 的 观测 值 来 更 新 对 状态 变量 的 估计 ， 求 出 当前 时 刻 的 估计 
值 。 算 法 根据 建立 的 系统 方程 和 观测 方程 对 需要 处 理 的 信号 做 出 满足 最 小 均 方 误差 的 估计 1 1。 
卡尔 曼 滤 波 的 特点 使 其 非常 适合 解决 复杂 多 传 感 带 估计 和 数据 融合 问题 "I， 且 在 数据 融合 的 应 
用 中 进一步 形成 了 扩展 卡尔 曼 滤 波 法 1'* 1 和 无 迹 卡 尔 曼 滤波 中 数据 融合 方法 。 当 前 ， 卡 尔 曼 渡 
波 法 已 经 广泛 地 应 用 在 数据 融合 的 研究 与 实践 中 。 例 如 ， 在 方法 的 研究 中 ，Sun Sp O°) 提出 了 一 
种 新 的 由 线性 最 小 方差 意义 下 的 矩阵 加 权 多 传 感 带 最 优 信 息 融 合 准 则 ， 给 出 了 一 种 具有 两 层 融 合 
结构 的 通用 多 传 感 费 最 优 信 息 融 合 分 散 卡 尔 曙 滤波 。Smyth SE O 则 提出 一 种 多 速率 卡尔 曼 滤波 
方法 来 解决 动态 系统 测量 位 移 和 加 速度 响应 的 数据 融合 问题 。 在 工程 数据 融合 的 实例 中 ,涉及 的 
领域 包含 了 航空 航天 、 自 动 癌 驶 以 及 无 人 系统 等 方面 。 

(2 )D-S 证 据 理论 (D-S Evidence Theory ) 

1967 年 ， 哈 佛 大 学 数学 家 Dempster'”| 在 利用 上 、 下 概率 来 解决 多 值 映射 问题 的 研究 中 ， 形 
成 了 该 理论 的 锥 形 。 在 其 理论 的 基础 上 ，1976 年 ，Shafer' ”| 进一步 完善 和 发 展 了 该 理论 ， 引 入 
了 信任 函数 (belief functions ) 的 概念 ， 建 立 了 基于 “证 据 ” 和 “组 合 ” 来 处 理 不 确定 性 问题 的 数 
学 方法 ， 并 出 版 了 代表 性 著作 《证 据 的 数据 理论 》( 4 Mathematical Theory of Evidence), ZHE 
是 一 种 处 理 不 确定 性 问题 的 理论 ， 在 信息 融合 、 专 家 系统 、 模 式 识别 等 领域 得 到 了 广泛 的 应 用 。 
D-S 证 据 理论 的 本 质 过 程 实际 上 是 通过 数学 的 方法 对 证 据 的 融合 ， 是 当前 数据 融合 研究 中 的 重要 
方法 和 方向 之 一 。 如 ， 在 实际 的 应 用 中 ， 该 方法 已 经 被 应 用 到 了 机 需 人 数据 融合 21、 诊断 信息 
融合 05 、 可 靠 性 数据 融合 5 以 及 火灾 探测 5 等 方面 的 研究 中 。 此 外 ， 在 使 用 过 程 中 ， 对 该 方 
法 的 修正 830!) 和 多 方法 融合 Yi 也 做 了 相关 的 研究 。 

(3 ) 神经 网 络 ( Neural Network ) 、 机 需 学 习 (Machine Learning ) 、 深 度 学 习 ( Deep Learning ) 
与 支持 向 量 机 (Support Vector Machine ) 

1943 年 ， 心 理学 家 Mcculloch 和 数学 家 Pitts 9) 提出 了 神经 网 络 的 相关 概念 和 模型 ， 开 创 了 
神经 网 络 研究 的 先河 。 神 经 网 络 分 析 的 基本 思想 是 模拟 人 脑 进 行 处 理 信息 的 方式 ， 将 信息 的 处 
理 过 程 分 为 输入 层 ， 中 间 层 〈 隐藏 层 ) 和 输出 层 。 神 经 网 络 自 诞 生 以 来 ， 也 取得 了 很 大 发 展 。 目 
前 ， 神 经 网 络 的 种 类 包含 了 BP 神经 网 络 、REF 神经 网 络 以 及 近年 来 发 展 起 来 的 卷 积 神经 网 络 等 
类 别 。 神 经 网 络 方法 用 于 数据 融合 研究 与 分 析 具 有 较 长 的 历史 。 在 本 研究 的 数据 集中 ， 神 经 网 络 
用 于 数据 融合 可 以 最 早 追 溯 到 1989 年 ，Whittington 等 054] 使 用 神经 网 络 方法 ， 对 战术 和 传感器 
的 数据 融合 问题 进行 分 析 ， 并 以 现代 海军 环境 为 案例 进行 了 分 析 和 研究。 基于 神经 网 络 的 分 析 方 
法 , 已 经 在 数据 融合 中 得 到 了 广泛 的 应 用 。 如 ，Chen 等 51 使 用 卷 积 神经 网 络 和 朴素 贝 叶 斯 的 
数据 融合 方法 ， 进 行 了 基于 深度 学 习 的 裂纹 检测 研究 。Kolanowski 等 3 使 用 Elman 神经 网 络 对 
多 传感器 数据 融合 进行 分 析 研 究 。 此 外 ， 基 于 神经 网 络 的 数据 融合 方法 在 目标 跟踪 .7 了 、 故 障 诊 
W, ER 2 等 数据 分 析 中 得 到 了 应 用 。 
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近期 ， 机 器 学 习 和 深度 学 习 方 法 较 多 地 应 用 在 了 数据 融合 研究 中 ， 是 数据 融合 方法 与 技术 
的 新 增长 点 。 机 顺 学 习 是 指 计算 机 通过 对 先 验 数据 集 的 决策 方法 进行 学 习 ， 从 而 具备 了 对 同类 数 
据 进行 预测 的 过 程 ， 是 人 工 智能 技术 的 一 个 重要 的 研究 领域 。 机 咒 学 习 按 照 学 习 方法 可 以 分 为 监 
督学 习 、 非 监督 学 习 和 半 监 督学 习 。 深 度 学 习 是 机 融 学 习 发 展 的 一 个 分 支 ， 其 目标 是 使 机 顺和 人 
一 样 具 有 分 析 能 力 。 机 器 学 习 能 够 实现 一 种 自动 化 的 数据 聚 类 、 分 类 或 预测 机 制 ， 因 此 对 于 数据 
融合 而 言 ， 机 顺 学 习 能 很 好 地 对 多 源 数据 进行 特征 分 析 和 提取 ， 并 在 学 习 规 则 的 驱动 下 进行 数据 
融合 。 目 前 ， 机 器 学 习 类 的 数据 融合 方法 :2 ， 已 经 被 大 量 应 用 在 各 个 领域 中 。 如 ， 这 些 方法 
已 经 被 应 用 于 腐蚀 测试 (corrosion testing) 3 、 智 慧 城 市 安全 4] 以 及 城市 大 数据 融合 i 等 研 
究 中 。 在 机 器 学 习 的 方法 家 族 中 ， 文 持 向 量 机 是 Cortes 和 Vapnik “4°! 于 1995 年 首次 提出 的 机 天 
学 习 方 法 ， 是 机 器 学 习 中 一 类 按 监督 学 习 方式 对 数据 进行 二 元 分 类 的 广义 线性 分 类 器 。 该 方法 具 
有 结构 简单 、 泛 化 能 力 强 等 优点 。 为 解决 小 样本 、 非 线性 、 高 维 数据 融合 提供 了 一 种 有 效 的 方 
法 上 ]。 如 ， 当 前 支持 向 量 机 方法 已 经 在 交通 信息 融合 8:、 目 标 追 踪 ! 1 以 及 遥感 数据 融合 :1 
等 方面 的 数据 融合 中 得 到 了 应 用 。 

(4) 模糊 逻辑 (Fuzzy Logic ) 

1965 年 ，Zadeh 发 表 了 《模糊 集合 》 论 文 ' ， 标 志 着 模糊 数学 的 诞生 。 在 数据 融合 中 ， 其 
表达 有 多 种 形式 ， 包 括 了 fuzzy control ( 模糊 控制 ) fuzzy inference ( 模糊 推理 ) fuzzy sets ( 模糊 
集合 ) 以 及 fuzzy theory (模糊 理论 ) 等 。 模 糊 逻 辑 对 现 有 数据 融合 方法 具有 强大 的 推动 作用 ， 很 
大 程度 上 提高 了 数据 融合 的 可 实现 性 。 如 ， 利 用 模糊 逻辑 可 以 生成 数据 融合 规则 权重 ， 进 而 服 
务 于 数据 融合 工作 的 开展 。 当 前 ， 模 糊 逻 辑 已 经 成 为 数据 融合 分 析 的 核心 方法 之 一 ， 被 大 量 应 
用 于 具体 场景 下 的 数据 融合 任务 中 。 例 如 ， 考 虑 到 多 传感器 观测 数据 的 不 确定 和 不 完整 性 ， 早 
在 1994 年 ，Abdulghafou 等 5 就 利用 模糊 逻辑 开发 了 基于 模糊 度 测度 的 融合 公式 ， 将 模糊 理论 
应 用 在 了 数据 融合 的 研究 中 。 此 外 ， 模 糊 逻 辑 也 在 目标 识别 ‘1、 和 车 联网 1 以 及 移动 机 带 人 导 
航 ' 等 场景 下 的 数据 融合 中 得 到 了 应 用 。 

(5) 小 波 分 析 (Wavelet Analysis ) 

小 波 分 析 又 称 小 波 变 换 ， 是 由 法 国 从 事 石 油 信 号 处 理 的 工程 师 J Morlet 于 1974 年 首先 提出 
信号 分 析 方 法 。 小 波 变 换 是 传 里 叶 变 换 的 一 种 扩展 方法 ， 提 供 了 一 种 时 域 - 频 域 的 表达 形式 。 作 
为 数学 的 一 个 研究 分 文 ， 该 方法 已 经 大 量 应 用 于 信和 号 分 析 、 图 像 处理 和 数值 分 析 等 领域 1。 特 
别 是 在 图 像 数据 需求 不 断 增长 的 背景 下 ， 小 波 分 析 在 图 像 处 理 和 图 像 融 合 中 发 挥 了 重要 的 价值 。 
如 ， 有 研究 采用 小 波 变 化 系数 ， 对 模糊 的 飞机 图 像 进 行 图 像 融合 分 析 与 处 理 ， 将 模糊 的 飞机 图 片 
转换 为 清晰 的 飞机 照片 31。 此 外 ， 小 波 变 换 的 方法 也 被 应 用 于 遥感 数据 融合 '” 1、 多 传 感 带 数据 
融合 '” 以 及 物 联网 数据 融合 ?1 等 方面 。 

(6) 贝 叶 斯 网 络 ( Bayesian Networks ) 

贝 叶 斯 网 络 又 称 信 念 网 络 (belief network ) 或 称 有 向 无 环 图 模型 (directed acyclic graphical 
model )， 是 一 种 概率 图 模型 。 作 为 基于 概率 数据 融合 的 方法 ， 早 期 的 研究 与 应 用 主要 聚焦 在 可 靠 
性 的 合并 中。 通过 先 验 信任 度 、 条 件 PDF ( 概率 密度 函数 ) 和 后 验 概率 来 表示 信任 /信念 的 程 
度 ， 然 后 基于 计算 后 的 后 验 概率 ， 依 据 贝 叶 斯 规则 进行 融合 ， 从 而 推测 得 到 总 可 靠 性 21。 在 基 
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于 贝 叶 斯 理论 的 数据 融合 实践 中 ， 早 在 1988 年 ，Z. Chair 就 发 表 论文 ， 讨 论 了 分 布 式 贝 叶 斯 与 分 
布 式 数 据 融合 的 相关 问题 。 随 后 ， 该 方法 在 数据 融合 中 得 到 了 广泛 的 应 用 。 如 : Vechet SH 1! R 
用 该 方法 对 传感器 数据 进行 了 融合 ; Guerriero 等 :4 研究 了 管道 泄漏 探测 中 贝 叶 斯 数据 融合 方法 
的 应 用 ; Trujilo-Barreto $E e! 将 该 方法 应 用 到 了 脑 电 图 / 脑 磁 图 (EEG/MEG ) 和 功能 性 核磁 共 
振 (fMRI ) 的 数据 融合 中 。 

(7) 语义 网 (Semantic Web ) 

语义 网 又 称 Web 3.0， 是 由 万 维 网 (WWW ) 的 创始 人 Tim Berners-Lee 于 1998 年 提出 的 概 
念 。 语 义 网 思路 的 核心 是 通过 给 万 维 网 上 的 文档 添加 能 够 被 计算 机 所 理解 的 语义 ， 从 而 使 整个 互 
联网 成 为 一 个 通用 的 信息 交换 介质 。 在 语义 网 中 ，RDF ( 资源 描述 框架 )、OWL ( 网 络 本 体 语 言 ) 
等 是 其 核心 方法 技术 。 语 义 网 从 某 种 意义 上 来 讲 ， 就 是 通过 统一 的 标准 来 使 存放 在 互联 网 上 的 数 
据 能 相互 关联 和 集成 使 用 ， 是 互联 网 数据 融合 的 核心 理论 。 当 前 语义 网 被 广泛 应 用 于 知识 的 融合 
中 ， 例 如 企业 知识 融合 、 钻 井 风 险 管理 的 知识 融合 :以 及 中 医 与 生物 医学 的 知识 融合 :1 等 
领域 。 从 其 技术 特征 来 看 ， 可 以 说 语义 网 是 以 网 络 为 载体 的 科技 文献 数据 集成 与 融合 的 核心 技 
术 ， 是 多 源 文献 数据 会 聚集 成 融合 赋 能 的 关键 。 


3 总 结 与 讨论 


数据 融合 是 当前 大 数据 时 代 实 现 多 源 数 据 价 值 的 重要 途径 ， 也 是 当前 复杂 信息 环境 下 科技 文 
献 数 据 研究 的 重点 。 数 据 融合 以 整体 论 的 思维 方式 ， 通 过 集成 多 源 数据 来 实现 对 特定 任务 与 场景 
的 系统 揭示 。 本 文 对 全 球 数据 融合 研究 的 整体 主题 和 方法 分 析 ， 或 许 对 认识 当前 数据 融合 的 研究 
有 一 定 参考 价值 。 

C1) 在 学 术 研 究 中 ， 数 据 融 合 有 悠久 的 历史 ， 但 受到 技术 发 展 阶段 和 实际 需求 的 影响 ， 数 据 
融合 的 方向 一 直 未 能 受到 足够 的 重视 和 广泛 的 应 用 。1999 年 和 2010 年 ， 是 数据 融合 研究 的 两 个 
转折 点 。1999~2009 年 ， 全 球 的 数据 融合 研究 呈现 出 了 前 所 未 有 的 研究 热度 ， 论 文 产 出 呈现 出 了 
显著 的 增长 趋势 。 经 历 2010 年 短暂 的 下 降 后 ， 整 体 产 出 又 呈现 出 了 显著 增长 。2010 年 以 后 数据 
融合 的 研究 在 大 数据 、 人 工 智能 、 物 联网 等 技术 背景 下 又 重新 兴起 。 与 此 同时 ， 数 据 驱 动 型 的 问 
题解 决 中 ， 数 据 融合 已 经 成 为 核心 的 任务 之 一 。 

2) 从 整个 数据 融合 研究 的 主题 格局 来 看 ， 按 照 检 索 词 形成 了 明显 的 主题 群落 。 在 当前 的 科 
学 研究 中 ， 以 传 感 天 的 数据 融合 为 主要 研究 方向 ， 且 无 线 传 感 需 网 络 数据 的 融合 已 经 独立 形成 了 
一 定 规模 的 主题 群 。 从 研究 的 成 熟 度 来 看 ， 传 感 融 数据 在 数据 融合 中 具有 悠久 的 历史 ， 也 最 为 成 
熟 。 军 事 上 对 传 感 融 数据 的 融合 需求 ， 促 进 了 数据 融合 事业 的 发 展 ， 也 为 数据 融合 积累 了 理论 和 
技术 条 件 。 多 源 传 感 天 数据 融合 技术 民用 以 后 ， 又 极 大 地 促进 了 工业 和 社会 生产 与 社会 治理 。 在 
新 的 时 代 背 景 下 ， 网 络 技术 发 展 迅 速 ， 并 为 实现 快速 的 多 源 数据 传输 和 融合 处 理 提 供 了 可 能 。 妆 
前 ， 数 据 融合 的 技术 与 方法 在 故障 诊断 、 安 全 以 及 智能 电网 等 方面 得 到 广泛 应 用 。 在 智能 化 快速 
发 展 的 背景 下 ， 数 据 融合 在 数 智 化 的 进程 中 也 将 发 挥 越 来 越 重 要 的 作用 。 

(3) 数据 融合 是 对 多 来 源 、 多 种 类 数据 的 融合 ， 其 任务 具有 显著 的 复杂 性 。 在 实际 的 数据 
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融合 工作 开展 中 ， 已 经 针对 不 同 的 数据 融合 需求 和 数据 特征 ， 形 成 了 较为 成 熟 的 数据 融合 方法 
体系 。 当 前 ， 在 所 有 的 数据 融合 方法 中 ， 以 卡尔 曼 滤 波 最 具 代 表 。 除 此 之 外 ，D-S 证 据 理论 、 聚 
类 /分 类 、 文 持 向 量 机 等 方法 也 在 不 同 的 数据 融合 场景 中 广泛 应 用 。 在 近期 的 数据 融合 研究 中 ， 
基于 深度 学 习 、 机 带 学 习 以 及 卷 积 神经 网 络 等 数据 融合 方法 也 已 经 兴起 。 在 不 断 的 发 展 过 程 中 ， 
数据 融合 研究 方法 也 走向 了 多 方法 的 融合 ， 已 经 形成 数据 融合 研究 的 “方法 网 络 ”。 

(4) 虽然 本 文 在 数据 检索 时 ， 未 对 数据 融合 、 信 息 融 合 和 知识 融合 进行 区 分 检索 ,但 从 分 析 
的 结果 来 看 ， 它 们 在 应 用 场景 上 存在 一 定 的 偏好 。Fusion 和 Aggregation TELE RAR TE PEH 
最 为 频繁 ， 其 中 ，Fusion AY (EH (id el eR EL, Aggregation CE Jilin [a] CZK (ZR air 
络 数据 融合 。Integration 的 场景 则 更 加 偏向 传 感 带 数据 之 外 的 其 他 数据 融合 ， 例 如 网 络 数 据 、 文 
本 知识 数据 等 。 这 三 个 词语 在 语言 学 上 的 意义 或 能 从 根本 上 解释 其 应 用 的 场景 ， 鉴 于 本 文 的 主要 
任务 ， 这 里 不 做 过 多 的 缆 述 。 

此 外 ， 就 数据 融合 的 具体 场景 来 看 ， 传 感 尖 数据 融合 研究 已 经 相对 成 熟 ， 且 形成 较 大 的 研究 
规模 。 因 此 ， 在 当前 科技 文献 多 源 数据 的 融合 研究 中 ， 可 以 在 一 定 程度 上 借鉴 其 融合 的 理论 、 方 
法 与 技术 ， 以 形成 科技 文献 数据 特有 的 数据 融合 理论 技术 体系 。 在 数据 作为 重要 生产 要 素 的 背景 
下 ,数据 要 实现 价值 最 大 化 ， 数 据 必须 也 必 将 走向 融合 。 
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Trends of Topics and Methods in Data Fusion 
Research 


Li Jie’? Yu Qiangian' Wang Yuju! 
(1. National Science Library, Chinese Academy of Sciences, Beijing 100190, China; 


2. Department of Information Resources Management, School of Economics and Management, 


University of Chinese Academy of Sciences, Beijing 100190, China) 


Abstract: [ Purpose/significance ] Data fusion is an important way to realize multi-source data value. 
Comprehensive analysis of the overall topics of global data fusion research has an important scientific and 
technological information value for the current data fusion research. [ Method/process ] The hot topics and 
research methods of 16053 literatures from Web of Science core collections were analyzed by word-frequency 
and co-word analysis. [ Result/conclusion ] The data fusion research has shown a significant growth 
trend, and after more than 30 years development, core research hotspots and methods of data fusion have 
been formed. In the research, the data fusion of sensors (including wireless sensors ) is the core research 
direction in this field. Fault diagnosis, remote sensing, security and smart grid are the hotspots of the data 
fusion scenario. Kalman Filter, Neural Network, Dempster-Shafer Evidence Theory and Machine Learning 
(including Deep Learning, Support Vector Machine, etc. ) are the main methods in data fusion, and the 
synergy network of methods have been formed in data fusion. 
Keywords: Data fusion; Information fusion; Knowledge fusion; Multi-source data integration; Co-word 
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